¿Perdidos en el espacio? Los modelos de visión-lenguaje tienen dificultades con la estimación de pose relativa de la cámara
Los modelos de visión-lenguaje presentan dificultades significativas al interpretar la pose relativa de la cámara. Conoce las limitaciones y avances.